6 research outputs found

    Obtención de reglas de clasificación difusas utilizando técnicas de optimización : Caso de estudio Riesgo Crediticio

    Get PDF
    El aporte central de esta tesis es la definición de un nuevo método capaz de generar un conjunto de reglas de clasificación difusas de fácil interpretación, baja cardinalidad y una buena precisión. Estas características ayudan a identificar y comprender las relaciones presentes en los datos facilitando de esta forma la toma de decisiones. El nuevo método propuesto se denomina FRvarPSO (Fuzzy Rules variable Particle Swarm Oprmization) y combina una red neuronal competitiva con una técnica de optimización basada en cúmulo de partículas de población variable para la obtención de reglas de clasificación difusas, capaces de operar sobre atributos nominales y numéricos. Los antecedentes de las reglas están formados por atributos nominales y/o condiciones difusas. La conformación de estas últimas requiere conocer el grado de pertenencia a los conjuntos difusos que definen a cada variable lingüística. Esta tesis propone tres alternativas distintas para resolver este punto. Uno de los aportes de esta tesis radica en la definición de la función de aptitud o fitness de cada partícula basada en un ”Criterio de Votación” que pondera de manera difusa la participación de las condiciones difusas en la conformación del antecedente. Su valor se obtiene a partir de los grados de pertenencia de los ejemplos que cumplen con la regla y se utiliza para reforzar el movimiento de la partícula en la dirección donde se encuentra el valor más alto. Con la utilización de PSO las partículas compiten entre ellas para encontrar a la mejor regla de la clase seleccionada. La medición se realizó sobre doce bases de datos del repositorio UCI (Machine Learning Repository) y tres casos reales en el área de crédito del Sistema Financiero del Ecuador asociadas al riesgo crediticio considerando un conjunto de variables micro y macroeconómicas. Otro de los aportes de esta tesis fue haber realizado una consideración especial en la morosidad del cliente teniendo en cuenta los días de vencimiento de la cartera otorgada; esto fue posible debido a que se tenía información del cliente en un horizonte de tiempo, una vez que el crédito se había concedido Se verificó que con este análisis las reglas difusas obtenidas a través de FRvarPSO permiten que el oficial de crédito de respuesta al cliente en menor tiempo, y principalmente disminuya el riesgo que representa el otorgamiento de crédito para las instituciones financieras. Lo anterior fue posible, debido a que al aplicar una regla difusa se toma el menor grado de pertenencia promedio de las condiciones difusas que forman el antecedente de la regla, con lo que se tiene una métrica proporcional al riesgo de su aplicación.Tesis en cotutela con la Universitat Rovira i Virgili (URV) (España).Facultad de InformáticaUniversitat Rovira i Virgil

    Simplifying credit scoring rules using LVQ + PSO

    Get PDF
    Purpose: One of the key elements in the banking industry relies on the appropriate selection of customers. To manage credit risk, banks dedicate special efforts to classify customers according to their risk. The usual decision-making process consists of gathering personal and financial information about the borrower. Processing this information can be time-consuming, and presents some difficulties because of the heterogeneous structure of data. Design/methodology/approach: This paper presents an alternative method that is able to generate rules that work not only on numerical attributes but also on nominal ones. The key feature of this method, called learning vector quantization and particle swarm optimization (LVQ + PSO), is the finding of a reduced set of classifying rules. This is possible because of the combination of a competitive neural network with an optimization technique. Findings: These rules constitute a predictive model for credit risk approval. The reduced quantity of rules makes this method useful for credit officers aiming to make decisions about granting a credit. It also could act as an orientation for borrower’s self evaluation about her/his creditworthiness. Research limitations/implications: In spite of the fact that conducted tests showed no evidence of dependence between results and the initial size of the LVQ network, it is considered desirable to repeat the measurements using an LVQ network of minimum size and a version of variable population PSO to adequately explore the solution space in the future. Practical implications: In the past decades, there has been an increase in consumer credit. Retail banking is a growing industry. Not only has there been a boom in credit card memberships, specially in emerging economies, but also an increase in small consumption credits. For example, it is very common in emerging economies that families buy home appliances on installments. In those countries, the association of a home appliance shop with a financial institution is usual, to provide customers with quick-decision credit line facilities. The existence of such a financial instrument aids to boost sales. This association generates conflict of interests. On one hand, the home appliance shop wants to sell products to all customers. Therefore, it is in its best interest to promote a generous credit policy. On the other hand, the financial institution wants to maximize the revenue from credits, leading to a strict surveillance of loan losses. Having a fair and transparent credit-granting policy favors a good business relationship between home appliances shops and financial institutions. One way of developing such a policy is to construct objective rules to decide to grant or deny a credit application. Social implications: Better credit decision rules generate enhanced risk sharing. In addition, it improves transparency in credit acceptance decisions, giving less room to arbitrary decisions. Originality/value: This study develops a new method that combines a competitive neural network and an optimization technique. It was applied to a real database of a financial institution in a developing country.Instituto de Investigación en Informátic

    Procesamiento inteligente de grandes volúmenes de información y de flujos de datos

    Get PDF
    Esta línea de investigación se centra en el estudio y desarrollo de Sistemas Inteligentes para la resolución de problemas de Big Data y Minería de Datos utilizando técnicas de Aprendizaje Automático. Los sistemas desarrollados se aplican particularmente al procesamiento de grandes volúmenes de información y al procesamiento de flujo de datos. Las investigaciones correspondientes al procesamiento de datos masivos están enfocadas en dos temas: el estudio y desarrollo de técnicas de reducción de características y el diseño de estrategias que faciliten el procesamiento masivo de datos a usuarios no informáticos. En lo referido a reducción de características, dado que se está trabajando con bases de datos genómicas, el foco está puesto en las estrategias de selección de atributos. El análisis a realizar sobre estos datos tiene por objetivo identificar grupos de genes cuyos patrones de expresión se encuentren asociados a fenotipos específicos. Por otro lado, se está desarrollando una librería con el objetivo de facilitar el manejo de bases de datos en contextos Big Data. Esto tendrá un impacto directo en el trabajo conjunto que se viene desarrollando junto con la Facultad de Ciencias Veterinarias de la UNLP en relación al análisis de datos de progenie de distintas especies animales. En cuanto a las investigaciones relacionadas con la Minería de Datos se centran en la construcción de modelos que faciliten la interpretación de los patrones obtenidos y la posterior extracción del conocimiento. En particular el énfasis está puesto en la resolución de dos problemas de sumo interés en distintas áreas: las técnicas de agrupamiento aplicables a flujos de datos y la generación de reglas de clasificación.Bases de Datos y Minería de DatosRed de Universidades con Carreras en Informátic

    Sistemas inteligentes: aplicaciones en minería de datos y big data

    Get PDF
    Esta línea de investigación se centra en el estudio y desarrollo de Sistemas Inteligentes para la resolución de problemas de Minería de Datos y Big Data utilizando técnicas de Aprendizaje Automático. Los sistemas desarrollados se aplican particularmente al procesamiento de grandes volúmenes de información y al procesamiento de flujo de datos. En el área de la Minería de Datos se está trabajando, por un lado, en la construcción de conjuntos de reglas de clasificación difusas que faciliten y permitan justificar la toma de decisiones y, por otro lado, en el diseño de técnicas de agrupamiento para flujos de datos con aplicación al análisis de trayectorias vehiculares para predecir congestión de tránsito. Con respecto al área de Big Data se está trabajando en el diseño y desarrollo de algoritmos de selección de características en grandes bases de datos de muchas columnas. Las implementaciones que se están llevando a cabo serán utilizadas en problemas de genómica molecular con el objetivo de determinar gene signatures. En esta misma línea se está trabajando sobre algoritmos de selección de características para el tratamiento de flujos de datos. Por otro lado y como transferencia tecnológica concreta, se efectuó un análisis sobre la producción de leche en ganado bovino a partir de la base de datos de la Asociación de la Región Pampeana de Entidades de Control Lechero (ARPECOL). En el área de la Minería de Textos se han desarrollado estrategias para resumir documentos a través de la extracción de los párrafos más representativos utilizando métricas de selección y técnicas de optimización.Eje: Base de Datos y Minería de Datos.Red de Universidades con Carreras en Informátic

    Extraction of Knowledge with Population-Based Metaheuristics Fuzzy Rules Applied to Credit Risk

    No full text
    One of the goals of financial institutions is to reduce credit risk. Consequently they must properly select customers. There are a variety of methodologies for credit scoring, which analyzes a wide variety of personal and financial variables of the potential client. These variables are heterogeneous making that their analysis is long and tedious. This paper presents an alternative method that, based on the subject information, offers a set of classification rules with three main characteristics: adequate precision, low cardinality and easy interpretation. This is because the antecedent consists of a small number of attributes that can be modeled as fuzzy variables. This feature, together with a reduced set of rules allows obtaining useful patterns to understand the relationships between data, and make the right decisions for the financial institutions. The smaller the number of analyzed variables of the potential customer, the simpler the model will be. In this way, credit officers may give an answer to the loan application in the shorter time, achieving a competitive advantage for the financial institution. The proposed method has been applied to two databases from the UCI repository, and a database from a credit unions cooperative in Ecuador. The results are satisfactory, as highlighted in the conclusions. Some future lines of research are suggested.Trabajo publicado en Tan, Y., Shi, Y., Tang, Q. (eds). Advances in Swarm Intelligence. ICSI 2018. Lecture Notes in Computer Science, vol. 10942. Springer, Cham.Facultad de Informátic

    Impacto de la educación virtual en los estudiantes de la modalidad presencial de la carrera de Administración Pública debido a la pandemia de Covid-19

    Get PDF
    The present investigation is a mixed quantitative and qualitative type, where the students of the face-to-face modality of the Faculty of Administrative Sciences, Public Administration career have been considered as a sample. This study aims to decipher the digital divide and the knowledge about information and communication technologies that students have to face virtuality. In addition, it is intended to identify the time they use to develop their studies, and carry out their personal activities. In this sense, digital connectivity and time management have been considered as study variables. Among the most visible results are the precarious connectivity, which minimizes the quality of learning for the student, the opportunity presented for teachers to use new tools, the prolonged use of devices and the Internet, the procrastination of academic activities and weakening of the socio-emotional health of the students.Debido a los cambios acontecidos en la educación superior y en el país en general por la pandemia del covid-19, fue necesario cambiar las actividades académicas de forma presencial a virtual. La Universidad Central de Ecuador, por lo tanto, ha tenido que adaptar sus normativas y políticas de acuerdo con la nueva realidad. Es así las diferentes facultades y carreras ahora desarrollan clases en línea a través de la plataformas virtuales como Moodle y herramientas como Microsoft Teams o Zoom, entre otras. La presente investigación es mixta de tipo cuantitativo y cualitativo, donde se ha considerado como muestra a los estudiantes de la modalidad presencial de la Facultad de Ciencias Administrativas, carrera de Administración Pública. Este estudio tiene como objetivo descifrar la brecha digital y el conocimiento sobre tecnologías de la información y comunicación que poseen los estudiantes para afrontar la virtualidad. Además, se pretende identificar el tiempo que utilizan para desarrollar sus estudios, y realizar sus actividades personales. En este sentido se ha considerado como variables de estudio la conectividad digital y la administración del tiempo.  Entre los resultados más visibles se menciona la precaria conectividad, que minimiza la calidad del aprendizaje para el estudiante, la oportunidad que se presenta para que los docentes utilicen nuevas herramientas, el uso prolongado de dispositivos e internet, la procrastinación de actividades académicas y debilitamiento de la salud socioemocional de los estudiantes
    corecore